On télécharge les fichiers de classement, et on supprime les skippers qui a abandonné la course dans chaque période.
Les fichiers Excel sont déjà téléchargées dans local
| Rang | Heure FR | Latitude | Longitude | Cap_since30min | Vitesse_since30min | VMG_since30min | Distance_since30min | Cap_lastReport | Vitesse_lastReport | ... | Vitesse_since24h | VMG_since24h | Distance_since24h | DTF | DTL | Nationalité | Voile | Skipper | Bateau | Date | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 1 | 15:30 FR\r\n | 46°24.46'N | 01°50.48'W | 241° | 17.7 kts | 17.5 kts | 0.3 nm | 357° | 0.0 kts | ... | 0.3 kts | 0.3 kts | 6.1 nm | 24293.9 nm | 0.0 nm | FRA | 18 | Louis Burton | Bureau Vallée 2 | 2020-11-08 |
| 1 | 2 | 15:31 FR\r\n1min | 46°24.34'N | 01°49.82'W | 241° | 11.1 kts | 10.9 kts | 0.4 nm | 357° | 0.0 kts | ... | 0.3 kts | 0.2 kts | 6.0 nm | 24294.2 nm | 0.4 nm | MON | 10 | Boris Herrmann | Seaexplorer - Yacht Club De Monaco | 2020-11-08 |
| 2 | 3 | 15:30 FR\r\n | 46°24.91'N | 01°49.99'W | 244° | 15.5 kts | 15.5 kts | 0.5 nm | 357° | 0.0 kts | ... | 0.2 kts | 0.2 kts | 5.5 nm | 24294.3 nm | 0.5 nm | FRA | 8 | Jérémie Beyou | Charal | 2020-11-08 |
| 3 | 4 | 15:30 FR\r\n | 46°24.71'N | 01°49.68'W | 244° | 13.2 kts | 13.1 kts | 0.7 nm | 357° | 0.0 kts | ... | 0.2 kts | 0.2 kts | 5.6 nm | 24294.5 nm | 0.6 nm | FRA | 59 | Thomas Ruyant | LinkedOut | 2020-11-08 |
| 4 | 5 | 15:30 FR\r\n | 46°24.59'N | 01°49.56'W | 246° | 10.9 kts | 10.9 kts | 0.2 nm | 357° | 0.0 kts | ... | 0.8 kts | 0.7 kts | 5.8 nm | 24294.5 nm | 0.6 nm | FRA | 53 | Maxime Sorel | V And B Mayenne | 2020-11-08 |
5 rows × 23 columns
Rang 0 Heure FR 0 Latitude 0 Longitude 0 Cap_since30min 0 Vitesse_since30min 0 VMG_since30min 0 Distance_since30min 0 Cap_lastReport 0 Vitesse_lastReport 0 VMG_lastReport 0 Distance_lastReport 0 Cap_since24h 0 Vitesse_since24h 0 VMG_since24h 0 Distance_since24h 0 DTF 0 DTL 0 Nationalité 0 Voile 0 Skipper 0 Bateau 0 Date 0 dtype: int64
Le tableau final de classement contient 13603 lignes et 23 colonnes.
Ensuite,on acquiert les fichiers de caractéristiques de bateau, on le transforme dans un DataFrame en indiquant le nom du bateau et le nom de skipper.
| Nom du bateau | Skipper | Numéro de voile | Anciens noms du bateau | Architecte | Chantier | Date de lancement | Longueur | Largeur | Tirant d'eau | Déplacement (poids) | Nombre de dérives | Hauteur mât | Voile quille | Surface de voiles au près | Surface de voiles au portant | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | NEWREST - ART & FENÊTRES | Fabrice Amedeo | FRA 56 | No Way Back, Vento di Sardegna | VPLP/Verdier | Persico Marine | 01 Août 2015 | 18,28 m | 5,85 m | 4,50 m | 7 t | foils | 29 m | monotype | 320 m2 | 570 m2 |
| 1 | PURE - Best Western® | Romain Attanasio | FRA 49 | Gitana Eighty, Synerciel, Newrest-Matmut | Bruce Farr Design | Southern Ocean Marine (Nouvelle Zélande) | 08 Mars 2007 | 18,28m | 5,80m | 4,50m | 9t | 2 | 28m | acier forgé | 280 m2 | 560 m2 |
| 2 | TSE - 4MYPLANET | Alexia Barrier | FRA72 | Famille Mary-Etamine du Lys, Initiatives Coeu... | Marc Lombard | MAG France | 01 Mars 1998 | 18,28m | 5,54m | 4,50m | 9t | 2 | 29 m | acier | 260 m2 | 580 m2 |
| 3 | Maître CoQ IV | Yannick Bestaven | 17 | Safran 2 - Des Voiles et Vous | Verdier - VPLP | CDK Technologies | 12 Mars 2015 | 18,28 m | 5,80 m | 4,50 m | 8 t | foils | 29 m | acier mécano soudé | 310 m2 | 550 m2 |
| 4 | CHARAL | Jérémie Beyou | 08 | NaN | VPLP | CDK Technologies | 18 Août 2018 | 18,28 m | 5,85 m | 4,50 m | 8t | foils | 29 m | acier | 320 m2 | 600 m2 |
0 0 1 0 2 0 3 0 4 1 5 0 6 0 7 0 8 0 9 0 10 1 11 0 12 0 13 0 14 1 15 0 16 13 17 0 18 0 19 0 20 0 21 0 22 0 23 0 24 0 25 0 26 2 27 0 28 1 29 1 30 0 31 1 32 1 33 2 dtype: int64
Vu que pour le skipper 'François Guiffant', on a presque aucune information sur son bateau, donc il ne sert pas à faire l'analyse, par conséquence, on le supprime de la liste.
Le tableau final de caratéristique de bateau contient 33 bateaux, avec 16 colonnes
| Longueur | Largeur | Tirant d'eau | Déplacement (poids) | Hauteur mât | Surface de voiles au près | Surface de voiles au portant | Nombre de dérives | |
|---|---|---|---|---|---|---|---|---|
| 0 | 18.28 | 5.85 | 4.5 | 7.0 | 29.0 | 320.0 | 570.0 | foils |
| 1 | 18.28 | 5.80 | 4.5 | 9.0 | 28.0 | 280.0 | 560.0 | 2 |
| 2 | 18.28 | 5.54 | 4.5 | 9.0 | 29.0 | 260.0 | 580.0 | 2 |
| 3 | 18.28 | 5.80 | 4.5 | 8.0 | 29.0 | 310.0 | 550.0 | foils |
| 4 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 600.0 | foils |
| 5 | 18.28 | 5.65 | 4.5 | 7.9 | 29.0 | 300.0 | 610.0 | foils |
| 6 | 18.28 | 5.80 | 4.5 | 7.6 | 28.0 | 300.0 | 600.0 | foils |
| 7 | 18.28 | 5.30 | 4.5 | 8.9 | 26.0 | 240.0 | 470.0 | 2 |
| 8 | 18.28 | 5.80 | 4.5 | 9.0 | 28.5 | 270.0 | 560.0 | 2 asymétriques |
| 9 | 18.28 | 5.70 | 4.5 | 7.7 | 29.0 | 340.0 | 570.0 | 2 |
| 10 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 350.0 | 560.0 | foils |
| 11 | 18.28 | 5.70 | 4.5 | 7.8 | 27.0 | 300.0 | 600.0 | foils |
| 12 | 18.28 | 5.60 | 4.5 | 8.5 | 29.0 | 250.0 | 650.0 | 2 |
| 13 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 300.0 | 700.0 | 2 |
| 14 | 18.28 | 5.50 | 4.5 | None | 27.4 | 300.0 | 600.0 | foils |
| 15 | 18.28 | 5.75 | 4.5 | 8.5 | 29.0 | 300.0 | 620.0 | 2 |
| 16 | 18.28 | 5.70 | 4.5 | 9.0 | 29.0 | 300.0 | 580.0 | 2 |
| 17 | 18.28 | 5.70 | 4.5 | 7.6 | 29.0 | 290.0 | 490.0 | foils |
| 18 | 18.28 | 5.80 | 4.5 | 8.5 | 28.0 | 270.0 | 580.0 | 2 |
| 19 | 18.28 | 5.60 | 4.5 | 7.7 | 27.0 | 300.0 | 650.0 | foils |
| 20 | 18.28 | 5.90 | 4.5 | 8.0 | 28.0 | 300.0 | 620.0 | 2 |
| 21 | 18.28 | 5.84 | 4.5 | 8.5 | 28.0 | 300.0 | 550.0 | foils |
| 22 | 18.28 | 5.50 | 4.5 | 8.5 | 28.0 | 330.0 | 600.0 | 2 |
| 23 | 18.28 | 5.80 | 4.5 | 8.0 | 29.0 | 300.0 | 600.0 | foils |
| 24 | 18.28 | 5.90 | 4.5 | None | 27.0 | 290.0 | 580.0 | foils |
| 25 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 350.0 | 560.0 | foils |
| 26 | 18.28 | 5.85 | 4.5 | 8.5 | 29.0 | 350.0 | 610.0 | 2 |
| 27 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 580.0 | foils |
| 28 | 18.28 | 5.70 | 4.5 | 8.0 | 29.0 | 260.0 | 600.0 | foiler |
| 29 | 18.28 | 5.50 | 4.5 | 7.7 | 29.0 | 365.0 | 700.0 | 2 |
| 30 | 18.28 | 5.40 | 4.5 | 7.7 | 29.0 | 330.0 | 630.0 | foils |
| 31 | 18.28 | 5.50 | 4.5 | 7.8 | 28.0 | 270.0 | 535.0 | foils |
| 32 | 18.28 | 5.70 | 4.5 | 7.9 | 27.3 | 270.0 | 535.0 | foils |
On remplit les valeurs manquants dans la colonne poids par la méthode KNN Regression
| Longueur | Largeur | Tirant d'eau | Déplacement (poids) | Hauteur mât | Surface de voiles au près | Surface de voiles au portant | Nombre de dérives | |
|---|---|---|---|---|---|---|---|---|
| 0 | 18.28 | 5.85 | 4.5 | 7.0 | 29.0 | 320.0 | 570.0 | foils |
| 1 | 18.28 | 5.80 | 4.5 | 9.0 | 28.0 | 280.0 | 560.0 | 2 |
| 2 | 18.28 | 5.54 | 4.5 | 9.0 | 29.0 | 260.0 | 580.0 | 2 |
| 3 | 18.28 | 5.80 | 4.5 | 8.0 | 29.0 | 310.0 | 550.0 | foils |
| 4 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 600.0 | foils |
| 5 | 18.28 | 5.65 | 4.5 | 7.9 | 29.0 | 300.0 | 610.0 | foils |
| 6 | 18.28 | 5.80 | 4.5 | 7.6 | 28.0 | 300.0 | 600.0 | foils |
| 7 | 18.28 | 5.30 | 4.5 | 8.9 | 26.0 | 240.0 | 470.0 | 2 |
| 8 | 18.28 | 5.80 | 4.5 | 9.0 | 28.5 | 270.0 | 560.0 | 2 asymétriques |
| 9 | 18.28 | 5.70 | 4.5 | 7.7 | 29.0 | 340.0 | 570.0 | 2 |
| 10 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 350.0 | 560.0 | foils |
| 11 | 18.28 | 5.70 | 4.5 | 7.8 | 27.0 | 300.0 | 600.0 | foils |
| 12 | 18.28 | 5.60 | 4.5 | 8.5 | 29.0 | 250.0 | 650.0 | 2 |
| 13 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 300.0 | 700.0 | 2 |
| 14 | 18.28 | 5.50 | 4.5 | 7.8 | 27.4 | 300.0 | 600.0 | foils |
| 15 | 18.28 | 5.75 | 4.5 | 8.5 | 29.0 | 300.0 | 620.0 | 2 |
| 16 | 18.28 | 5.70 | 4.5 | 9.0 | 29.0 | 300.0 | 580.0 | 2 |
| 17 | 18.28 | 5.70 | 4.5 | 7.6 | 29.0 | 290.0 | 490.0 | foils |
| 18 | 18.28 | 5.80 | 4.5 | 8.5 | 28.0 | 270.0 | 580.0 | 2 |
| 19 | 18.28 | 5.60 | 4.5 | 7.7 | 27.0 | 300.0 | 650.0 | foils |
| 20 | 18.28 | 5.90 | 4.5 | 8.0 | 28.0 | 300.0 | 620.0 | 2 |
| 21 | 18.28 | 5.84 | 4.5 | 8.5 | 28.0 | 300.0 | 550.0 | foils |
| 22 | 18.28 | 5.50 | 4.5 | 8.5 | 28.0 | 330.0 | 600.0 | 2 |
| 23 | 18.28 | 5.80 | 4.5 | 8.0 | 29.0 | 300.0 | 600.0 | foils |
| 24 | 18.28 | 5.90 | 4.5 | 8.4 | 27.0 | 290.0 | 580.0 | foils |
| 25 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 350.0 | 560.0 | foils |
| 26 | 18.28 | 5.85 | 4.5 | 8.5 | 29.0 | 350.0 | 610.0 | 2 |
| 27 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 580.0 | foils |
| 28 | 18.28 | 5.70 | 4.5 | 8.0 | 29.0 | 260.0 | 600.0 | foiler |
| 29 | 18.28 | 5.50 | 4.5 | 7.7 | 29.0 | 365.0 | 700.0 | 2 |
| 30 | 18.28 | 5.40 | 4.5 | 7.7 | 29.0 | 330.0 | 630.0 | foils |
| 31 | 18.28 | 5.50 | 4.5 | 7.8 | 28.0 | 270.0 | 535.0 | foils |
| 32 | 18.28 | 5.70 | 4.5 | 7.9 | 27.3 | 270.0 | 535.0 | foils |
| Longueur | Largeur | Tirant d'eau | Déplacement (poids) | Hauteur mât | Surface de voiles au près | Surface de voiles au portant | Nombre de dérives | Skipper | |
|---|---|---|---|---|---|---|---|---|---|
| 0 | 18.28 | 5.85 | 4.5 | 7.0 | 29.0 | 320.0 | 570.0 | foils | Fabrice Amedeo |
| 1 | 18.28 | 5.80 | 4.5 | 9.0 | 28.0 | 280.0 | 560.0 | 2 | Romain Attanasio |
| 2 | 18.28 | 5.54 | 4.5 | 9.0 | 29.0 | 260.0 | 580.0 | 2 | Alexia Barrier |
| 3 | 18.28 | 5.80 | 4.5 | 8.0 | 29.0 | 310.0 | 550.0 | foils | Yannick Bestaven |
| 4 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 600.0 | foils | Jérémie Beyou |
['Longueur ', 'Largeur ', "Tirant d'eau ", 'Déplacement (poids) ', 'Hauteur mât ', 'Surface de voiles au près ', 'Surface de voiles au portant ', 'Nombre de dérives ']
| Rang | Heure FR | Latitude | Longitude | Cap_since30min | Vitesse_since30min | VMG_since30min | Distance_since30min | Cap_lastReport | Vitesse_lastReport | ... | Date | id | Longueur | Largeur | Tirant d'eau | Déplacement (poids) | Hauteur mât | Surface de voiles au près | Surface de voiles au portant | Nombre de dérives | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 1 | 15:30 FR\r\n | 46°24.46'N | 01°50.48'W | 241° | 17.7 kts | 17.5 kts | 0.3 nm | 357° | 0.0 kts | ... | 2020-11-08 | 0 | 18.28 | 5.80 | 4.5 | 7.6 | 28.0 | 300.0 | 600.0 | foils |
| 1 | 2 | 15:31 FR\r\n1min | 46°24.34'N | 01°49.82'W | 241° | 11.1 kts | 10.9 kts | 0.4 nm | 357° | 0.0 kts | ... | 2020-11-08 | 1 | 18.28 | 5.70 | 4.5 | 7.6 | 29.0 | 290.0 | 490.0 | foils |
| 2 | 3 | 15:30 FR\r\n | 46°24.91'N | 01°49.99'W | 244° | 15.5 kts | 15.5 kts | 0.5 nm | 357° | 0.0 kts | ... | 2020-11-08 | 2 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 320.0 | 600.0 | foils |
| 3 | 4 | 15:30 FR\r\n | 46°24.71'N | 01°49.68'W | 244° | 13.2 kts | 13.1 kts | 0.7 nm | 357° | 0.0 kts | ... | 2020-11-08 | 3 | 18.28 | 5.85 | 4.5 | 8.0 | 29.0 | 350.0 | 560.0 | foils |
| 4 | 5 | 15:30 FR\r\n | 46°24.59'N | 01°49.56'W | 246° | 10.9 kts | 10.9 kts | 0.2 nm | 357° | 0.0 kts | ... | 2020-11-08 | 4 | 18.28 | 5.50 | 4.5 | 7.7 | 29.0 | 365.0 | 700.0 | 2 |
5 rows × 32 columns
(13603, 32)
| Skipper | Rang | VMG_since30min | VMG_lastReport | VMG_since24h | Vitesse_since30min | Vitesse_lastReport | Vitesse_since24h | Nombre de dérives | Distance_since30min | Distance_lastReport | Distance_since24h | DTF | DTL | Date | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | Louis Burton | 1 | 17.5 | 0.0 | 0.3 | 17.7 | 0.0 | 0.3 | foils | 0.3 | 2788.0 | 6.1 | 24293.9 | 0.0 | 2020-11-08 |
| 1 | Boris Herrmann | 2 | 10.9 | 0.0 | 0.2 | 11.1 | 0.0 | 0.3 | foils | 0.4 | 2787.9 | 6.0 | 24294.2 | 0.4 | 2020-11-08 |
| 2 | Jérémie Beyou | 3 | 15.5 | 0.0 | 0.2 | 15.5 | 0.0 | 0.2 | foils | 0.5 | 2788.5 | 5.5 | 24294.3 | 0.5 | 2020-11-08 |
| 3 | Thomas Ruyant | 4 | 13.1 | 0.0 | 0.2 | 13.2 | 0.0 | 0.2 | foils | 0.7 | 2788.3 | 5.6 | 24294.5 | 0.6 | 2020-11-08 |
| 4 | Maxime Sorel | 5 | 10.9 | 0.0 | 0.7 | 10.9 | 0.0 | 0.8 | 2 | 0.2 | 2788.1 | 5.8 | 24294.5 | 0.6 | 2020-11-08 |
[0.78, 0.74, -1.31, 0.8, 0.71, 0.21, 0.19, 0.41, 0.7, 0.2, 0.66, 0.74, 0.2, 0.65, 0.74, 0.61, 0.22, 0.82, 0.52, 0.66, 0.63, 0.88, 0.13, 0.69, 0.24, 0.65, 0.75, 0.65, 0.67, 0.14, 0.39, 0.82, 0.32, 0.6, 0.72, 0.05, 0.86, -0.35, -0.09, 0.66, 0.62, 0.72, -0.46, 0.11, 0.73, 0.73, 0.73, 0.02, 0.49, 0.67, 0.7, 0.28, 0.81, 0.83, 0.71, 0.72, 0.8, 0.63, 0.74, 0.67, 0.6, 0.4, 0.09, 0.18, 0.78, 0.18, 0.07, 0.38, 0.73, 0.8, 0.5, 0.69, 0.87, 0.57, 0.69, 0.09, 0.77, 0.18, 0.62, 0.61, 0.66, 0.83, 0.66, 0.2, 0.04, 0.74, 0.8, 0.59, 0.67, 0.28, 0.4, 0.32, 0.79, 0.54, 0.61, 0.34, 0.59, 0.71, 0.53, 0.72] la score moyenne en appliquant indépendamment 100 fois la regression linéaire sur les données est : 0.5073
Conclusion : On peut voir que parfois on obtient un résultat presque parfait avec un score de R2 égale à 0.98, mais parfois le score est très bas, c'est peut-être à cause de la façon aléatoire de séparation entre les données d'entrainement de les données de test.
Text(0.5, 1.0, 'Corrélation et régression linéaire entre le rang et la VMG')
| Rang | Vitesse_since30min | Vitesse_lastReport | Vitesse_since24h | |
|---|---|---|---|---|
| Nombre de dérives | ||||
| 2 | 17.180887 | 12.457305 | 12.245506 | 11.753015 |
| 2 asymétriques | 21.029289 | 12.279916 | 11.909623 | 11.386192 |
| foiler | 10.398734 | 14.397468 | 14.004430 | 13.120886 |
| foils | 12.436308 | 13.873965 | 13.546493 | 12.872204 |
Text(0.5, 1.0, "Impact de la présence d'un foil ")
Conclusion : On peut voir que avec la présence d'un foil, le classement est généralement plus haut que celle qui n'a pas de foil, et la vitesse des voiliers est aussi plus rapide. Donc on peut conclure que la présence d'un foil a une influence positif sur la course.
<matplotlib.legend.Legend at 0x1582fdc90a0>
| id | Latitude | Longitude | |
|---|---|---|---|
| 0 | 0 | 46°24.46'N | 01°50.48'W |
| 1 | 1 | 46°24.34'N | 01°49.82'W |
| 2 | 2 | 46°24.91'N | 01°49.99'W |
| 3 | 3 | 46°24.71'N | 01°49.68'W |
| 4 | 4 | 46°24.59'N | 01°49.56'W |
| id | Lat | Lon | |
|---|---|---|---|
| 0 | 0 | 46.407667 | -1.841333 |
| 8619 | 0 | -55.450000 | -154.332667 |
| 4772 | 0 | -41.780333 | 30.282500 |
| 8646 | 0 | -55.434000 | -153.437833 |
| 999 | 0 | 35.270667 | -24.115167 |
| ... | ... | ... | ... |
| 3106 | 32 | -3.162667 | -31.587500 |
| 13017 | 32 | -22.471167 | -28.590167 |
| 1304 | 32 | 31.537333 | -25.853667 |
| 7031 | 32 | -44.050500 | 73.457833 |
| 1602 | 32 | 27.325167 | -26.787667 |
13603 rows × 3 columns